05. 终端调用的步骤
- 你可以通过在predictor上调用.deploy()并传入有关该实例的一些信息来启动端点。
xgb_predictor = xgb.deploy(initial_instance_count = 1, instance_type = 'ml.m4.xlarge')
- 然后,你需要告诉你的端点,它希望将哪种类型的数据视为输入(如.csv)。
from sagemaker.predictor import csv_serializer
xgb_predictor.content_type = 'text/csv'
xgb_predictor.serializer = csv_serializer
- 下一步,进行推理(inference)。你可以将一些数据作为消息的“正文”传递给端点并获得回复。
response = runtime.invoke_endpoint(EndpointName = xgb_predictor.endpoint, # The name of the endpoint we created
ContentType = 'text/csv', # The data format that is expected
Body = ','.join([str(val) for val in test_bow]).encode('utf-8'))
- 推理数据存储在响应的“正文”中,可以如下获取:
response = response['Body'].read().decode('utf-8')
print(response)
- 最后,不要忘记在完成使用后关闭终端。
xgb_predictor.delete_endpoint()